Reguläre Ausdrücke / Regular Expressions („RegEx‘“) 


Reguläre Ausdrücke (engl.: Regular Expressions, Abk.: RegEx) sind ein mächtiges Werkzeug zur Verarbeitung von 
Zeichenketten. Sie kommen in vielen Programmiersprachen und Filterprogrammen zum Einsatz. 





Vordefinierte Zeichenklassen 


ein beliebiges Zeichen 


\d eine Dezimalziffer 
[0-9] 
\D ein Zeichen, das keine 


Dezimalziffer ist 


\s ein Leerraumzeichen 
(Whitespace) 
[ \t\n\x08\x0c\r] 


\S ein Zeichen, das kein 
Leerraumzeichen ist 


\w ein Wortzeichen 
[|_A-Za-z0-9] 


\w ein Zeichen, das kein 
Wortzeichen ist 














Zeichen 

x das Zeichen „x“ 

\t Horizontal-Tabulator (Tab) 

\n Zeilenumbruch, neue Zeile 
(New Line, Line Feed, LF) 

\r Schlittenrücklauf (Carriage 
Return, CR) 

\xhh Zeichen mit 
Hexadezimalwert hh 

\uhhhh Unicodezeichen mit 
Hexadezimalwert hhhhh 

x hebt ggf. die Metabedeutung 
des nächsten Zeichens auf 

\\ Rückwärtsschrägstrich 
(Blackslash) „\" 

\( das Zeichen „(* 

\L das Zeichen „[* 

\t das Zeichen „{* 

Nr das Punkt-Zeichen „* 

Kr das Zirkumflex-Zeichen „“* 

\$ das Dollar-Zeichen „$“ 

Zeichenklassen 

[abc] eines der Zeichen „a‘, „b" 
und „c“ 

[*abc] alles außer eines der Zeichen 
„a, „b“ und ei 

[A-2] eines der Zeichen: „A“ bis „Z* 

[A-Za-z] eines die Zeichen „A bis „2“ und 


la-z&&[”st]] 





“cc = “ 
„a“ bis „z 


eines der Zeichen „a“ bis „z“ 
außer die Zeichen „s“ und „t“ 


POSIX-Zeichenklassen 





\p{Upper} ein ASCII-Großbuchstabe 
[A-2] 

\p{Lower} ein ASCII-Kleinbuchstabe 
[a-z] 

\p{ASCII} ein ASCII-Zeichen 
[\xX00-\x7£] 

\p{Alpha} ein ASCII-Buchstabe 
[IA-Za-z] 

\p{lDigit} eine ASCII-Dezimalziffer 
[0-9] 

\p{Alnum} ein ASCIH Buchstabe oder 

eine ASCII-Dezimalziffer 

[A-Za-z0-9] 

















Unicode-Zeichenklassen 


\p{Lu} ein Unicode-Großbuchstabe 
\p{L1} ein Unicode-Kleinbuchstabe 
\p{Sc} ein Unicode-Währungssymbol 
\p{N1} ein Unicode-Buchstabe oder 


eine Unicode-Dezimalziffer 











Grenzen 


sucht vom Zeilenanfang an 











$ sucht bis Zeilenende 

\< leere Zeichenkette am 
Wortanfang 

\> leere Zeichenkette am 
Wortende 

\b leere Zeichenkette am 
Wortanfang oder am Wortende 

\B leere Zeichenkette, die nicht 
den Anfang oder das Ende 
eines Wortes bildet 

\A Anfang der Eingabe 

\z Ende der Eingabe 

Wiederholungen 

® vorheriges Zeichen darf kein 
mal oder einmal wiederholt 
sein (einmal oder gar nicht) 

2.B.: a? 

% vorheriges Zeichen darf 
beliebig oft wiederholt sein, 
oder gar nicht vorkommen 
(mehrmals oder gar nicht) 

z.B.: a* 

+ vorheriges Zeichen darf 
beliebig oft wiederholt sein, 
soll aber mindestens einmal 
vorkommen (mindestens 
einmal) 

z.B.: at 
{n} exakt n-mal 
z.B.: a{3} 
{n,} mindestens n-mal 
z.B.: a{3,} 
{n,m} n- bis m-mal 
2.B.: a{3,7} 
{0,n} maximal n-mal 


z.B.: a{0,7} 


Logische Operatoren 











xY X gefolgt von Y 
x|Y X oder Y 
(X) X als Gruppe 
(?:xX) X als Gruppe ohne spätere 
Bezugsmöglichkeit 
x(?=Y) auf X muß Y folgen 
x(?'!y) auf X darf kein Y folgen 
(?<=X)Y X muß vor Y stehen 
(?<!x)Y X darf nicht vor Y stehen 
(?(B)wI|rF) Wenn die gegebene 
„Bedingung“ B gefunden wird, 
kommt der „wahr-Ausdruck“ W 
zur Anwendung, andernfalls 
kommt der „falsch-Ausdruck“ 
F zur Anwendung. 
Signale (Flags) 
(?i) Groß-/Kleinschreibung 
unabhängig (ASCH) 
(?iu) Groß-/Kleinschreibung 
unabhängig (Unicode) 
(?m) mehrzeiliger Modus 
(?s) Einzelzeilen- / Punktall-Modus 











Hinweise (für den mehrzeiligen Modus) 


\n 
\r 


\n\r 
\r\n 


Links: 


ein Zeilenumbruch im Unix/Linux-Format 


ein Zeilenumbruch im alten MacOS- 
Format (bis1996) 


ein Zeilenumbruch im MacOS-Format 


ein Zeilenumbruch im DOS- und 
Windows-Format 


jex.im regviz.org 
debuggex.com txt2re.com 
myregextester.com 


youtu.be/2808MhvCFGl 





